存在许多背景,存在二元数据。社交网络是一个众所周知的例子。在这些情况下,成对的元素是链接的,建立一个反映交互的网络。解释为什么建立这些关系对于获得透明度至关重要,这是一个日益重要的概念。由于自然语言理解任务的传播,这些解释通常是使用文本提出的。我们的目的是代表和解释任何代理人建立的对(例如,推荐系统或付费促销机制),以便考虑到基于文本的个性化。我们已经专注于TripAdvisor平台,考虑到其他二元数据上下文的适用性。这些项目是用户和餐馆的子集以及这些用户发布的评论的互动。我们提出了PTER(个性化基于文本的评论)模型。我们可以从适合特定用户交互的特定餐厅的可用评论中预测。 PTER利用BERT(Transformers来自Transformers transformer-ododer模型的双向编码器表示)。我们按照基于功能的方法定制了一个深神网络,并介绍了LTR(学习排名)下游任务。根据额外的(解释排名)基准,我们与随机基线和其他最新模型进行了几次比较。我们的方法的表现优于其他协作过滤建议。
translated by 谷歌翻译
新闻事实检查的一个重要挑战是对现有事实核对的有效传播。反过来,这需要可靠的方法来检测先前事实检查的主张。在本文中,我们专注于自动寻找在社交媒体帖子(推文)中提出的索赔的现有事实检查。我们使用多语言变压器模型(例如XLM-Roberta和多语言嵌入者,例如Labse and Sbert)进行单语(仅英语),多语言(西班牙语,葡萄牙语)和跨语性(印度英语)设置进行分类和检索实验。我们提供了四个语言对的“匹配”分类(平均准确性86%)的有希望的结果。我们还发现,在单语实验中,BM25基线的表现胜过或与最先进的多语言嵌入模型相提并论。我们在以不同的语言来解决此问题的同时,强调和讨论NLP挑战,并介绍了一个新颖的事实检查数据集和相应的推文,以供将来的研究。
translated by 谷歌翻译